量子位 05-08 22:00

Anthropic出手！AI的内心独白，曝光了

📌 一句话：Anthropic发布新技术，让AI的"内心独白"可视化，AI不再是个黑箱。

Anthropic一直强调AI安全与可控，这次曝光AI思维过程，被视为其"负责任AI"理念的落地产品。

让AI"透明"是把双刃剑：一方面它能建立信任、帮助排查错误；另一方面，把AI的思考过程完全公开，可能被人用来"逆向工程"绕过安全限制。透明度≠安全性，Anthropic这一步迈得漂亮，但后续如何守住安全底线，才是真正的考验。

📖 原文链接